2 research outputs found

    Estudio y mejora de sistemas de verificación de locutores bajo condiciones de voz afónica

    Get PDF
    Este proyecto analiza las diferencias entre distintos modos del habla, en especial el susurro, utilizado como medio de comunicación cuando se padece una enfermedad como la afonı́a, y cómo afectan a los sistemas de verificación automática de locutores. El objetivo del proyecto es el estudio de la pérdida de prestaciones, y la mejora de los sistemas mediante la aplicación de distintas técnicas.El estudio parte del análisis de las señales en los dominios de voz susurrada y voz neutra, cuyas diferencias explican el detrimento del sistema. Para cuantificarlo, se escogen un sistema de referencia de altas prestaciones y una base de datos que cuenta con audios en condiciones de habla normal y susurrada.Las técnicas de mejora estudiadas abordan el problema en distintos puntos del sistema completo. Estas técnicas se introducen de forma teórica en el segundo bloque del trabajo, y en el tercer bloque se muestran los resultados obtenidos para cada una de ellas. Para evaluarlas y compararlas se utilizan herramientas de software libre, herramientas de visualización y entrenamiento de modelos estadı́sticos utilizando Python como lenguaje de programación principal. El trabajo muestra el rendimiento de herramientas alternativas a los algoritmos populares de aprendizaje automático, necesarias cuando no se dispone de una cantidad significativa de datos que permitan buenos resultados.<br /

    Desarrollo de un sistema de procesado de imagen para la obtención de imágenes similares

    Get PDF
    El objetivo del trabajo es el desarrollo de un sistema de búsqueda de imágenes similares utilizando técnicas de procesado de imagen. Se extraen las características tanto de la imagen de entrada al sistema como de las imágenes almacenadas en la base de datos, aplicando sobre ellas el mismo procesado. Se calcula la distancia entre la imagen de entrada y todas las de la base de datos y se muestran aquellas imágenes de la base de datos que presenten una distancia menor con respecto a la imagen de entrada. Para presentar el sistema se utiliza una aplicación cliente-servidor
    corecore